AI资讯新闻榜单内容搜索-Scaling La

2030年，Scaling Law会到达极限吗？GPT-6能出来吗？

9 月 2 日，马斯克发文称，其人工智能公司 xAI 的团队上线了一台被称为「Colossus」的训练集群，总共有 100000 个英伟达的 H100 GPU。

来自主题: AI资讯

6672 点击 2024-09-08 10:50

跟两位亲历者聊聊OpenAI崛起的关键：兴趣驱动的探索，而非目标导向的马拉松

沿着 Scaling Law、卷模型性能，可能会走到「死胡同」。

来自主题: AI资讯

8276 点击 2024-09-07 09:20

亲历者揭秘 OpenAI 崛起的关键：兴趣驱动的探索，而非目标导向的马拉松

沿着 Scaling Law、卷模型性能，可能会走到「死胡同」。谁在影响、定义我们的时代？他们做了什么，如何思考？对话关键人物，记录历史底稿。我们被倡导要想明白自己的目标是什么、并做出计划。然而，两位人工智能研究者却认为，这只适用于普通的小愿望。

来自主题: AI资讯

4702 点击 2024-09-04 09:34

2024年中国AI基础数据服务研究报告

近年来，Transformer等预训练大模型在语言理解及生成等领域表现出色，大模型背后的Scaling Law（规模定律）进一步揭示了模型性能与数据量、算力之间的关系，强化了数据在提升AI表现中的关键作用。

来自主题: AI资讯

7672 点击 2024-09-03 10:04

MoE再下一城！港大提出AnyGraph：首次开启「图大模型」Scaling Law之路

AnyGraph聚焦于解决图数据的核心难题，跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结构和特征异质性，通过轻量化路由机制和高效设计提升快速适应能力，且在泛化能力上符合Scaling Law。

来自主题: AI技术研报

10293 点击 2024-09-02 16:35

LLM的范式转移：RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

来自主题: AI资讯

9973 点击 2024-08-31 11:19